当前位置: 开发笔记 > 编程语言 > 正文

车辆|发生率_YYDS！Python实现自动驾驶

作者：幻想6666_321 | 来源：互联网 | 2023-09-13 17:53

篇首语：本文由编程笔记#小编为大家整理，主要介绍了YYDS！Python实现自动驾驶相关的知识，希望对你有一定的参考价值。来源：blog.cs

篇首语：本文由编程笔记#小编为大家整理，主要介绍了YYDS！Python实现自动驾驶相关的知识，希望对你有一定的参考价值。

来源&＃xff1a;blog.csdn.net/weixin_44169614?type&＃61;blog

一、安装环境

gym是用于开发和比较强化学习算法的工具包&＃xff0c;在python中安装gym库和其中子场景都较为简便。

安装gym&＃xff1a;

pip install gym

安装自动驾驶模块&＃xff0c;这里使用Edouard Leurent发布在github上的包highway-env&＃xff08;链接&＃xff1a;https://github.com/eleurent/highway-env&＃xff09;&＃xff1a;

pip install --user git&＃43;https://github.com/eleurent/highway-env

其中包含6个场景&＃xff1a;

高速公路——“highway-v0”
汇入——“merge-v0”
环岛——“roundabout-v0”
泊车——“parking-v0”
十字路口——“intersection-v0”
赛车道——“racetrack-v0”

详细文档可以参考这里&＃xff1a;

https://highway-env.readthedocs.io/en/latest/

二、配置环境

安装好后即可在代码中进行实验&＃xff08;以高速公路场景为例&＃xff09;&＃xff1a;

import gym import highway_env %matplotlib inline env &＃61; gym.make(&＃39;highway-v0&＃39;) env.reset() for _ in range(3): action &＃61; env.action_type.actions_indexes["IDLE"] obs, reward, done, info &＃61; env.step(action) env.render()

运行后会在模拟器中生成如下场景&＃xff1a;

绿色为ego vehicle env类有很多参数可以配置&＃xff0c;具体可以参考原文档。

三、训练模型

1、数据处理

(1)state

highway-env包中没有定义传感器&＃xff0c;车辆所有的state (observations) 都从底层代码读取&＃xff0c;节省了许多前期的工作量。根据文档介绍&＃xff0c;state (ovservations) 有三种输出方式&＃xff1a;Kinematics&＃xff0c;Grayscale Image和Occupancy grid。

Kinematics

输出V*F的矩阵&＃xff0c;V代表需要观测的车辆数量&＃xff08;包括ego vehicle本身&＃xff09;&＃xff0c;F代表需要统计的特征数量。例&＃xff1a;

数据生成时会默认归一化&＃xff0c;取值范围&＃xff1a;[100, 100, 20, 20]&＃xff0c;也可以设置ego vehicle以外的车辆属性是地图的绝对坐标还是对ego vehicle的相对坐标。

在定义环境时需要对特征的参数进行设定&＃xff1a;

config &＃61; \\ "observation": "type": "Kinematics", #选取5辆车进行观察&＃xff08;包括ego vehicle&＃xff09; "vehicles_count": 5, #共7个特征 "features": ["presence", "x", "y", "vx", "vy", "cos_h", "sin_h"], "features_range": "x": [-100, 100], "y": [-100, 100], "vx": [-20, 20], "vy": [-20, 20] , "absolute": False, "order": "sorted" , "simulation_frequency": 8, # [Hz] "policy_frequency": 2, # [Hz]

Grayscale Image

生成一张W*H的灰度图像&＃xff0c;W代表图像宽度&＃xff0c;H代表图像高度

Occupancy grid

生成一个WHF的三维矩阵&＃xff0c;用W*H的表格表示ego vehicle周围的车辆情况&＃xff0c;每个格子包含F个特征。

(2) action

highway-env包中的action分为连续和离散两种。连续型action可以直接定义throttle和steering angle的值&＃xff0c;离散型包含5个meta actions&＃xff1a;

ACTIONS_ALL &＃61; 0: &＃39;LANE_LEFT&＃39;, 1: &＃39;IDLE&＃39;, 2: &＃39;LANE_RIGHT&＃39;, 3: &＃39;FASTER&＃39;, 4: &＃39;SLOWER&＃39;

(3) reward

highway-env包中除了泊车场景外都采用同一个reward function&＃xff1a;

这个function只能在其源码中更改&＃xff0c;在外层只能调整权重。&＃xff08;泊车场景的reward function原文档里有&＃xff0c;懒得打公式了……&＃xff09;

2、搭建模型

DQN网络的结构和搭建过程已经在我另一篇文章中讨论过&＃xff0c;所以这里不再详细解释。我采用第一种state表示方式——Kinematics进行示范。

由于state数据量较小&＃xff08;5辆车*7个特征&＃xff09;&＃xff0c;可以不考虑使用CNN&＃xff0c;直接把二维数据的size[5,7]转成[1,35]即可&＃xff0c;模型的输入就是35&＃xff0c;输出是离散action数量&＃xff0c;共5个。

import torch import torch.nn as nn from torch.autograd import Variable import torch.nn.functional as F import torch.optim as optim import torchvision.transforms as T from torch import FloatTensor, LongTensor, ByteTensor from collections import namedtuple import random Tensor &＃61; FloatTensor EPSILON &＃61; 0 # epsilon used for epsilon greedy approach GAMMA &＃61; 0.9 TARGET_NETWORK_REPLACE_FREQ &＃61; 40 # How frequently target netowrk updates MEMORY_CAPACITY &＃61; 100 BATCH_SIZE &＃61; 80 LR &＃61; 0.01 # learning rate class DQNNet(nn.Module): def __init__(self): super(DQNNet,self).__init__() self.linear1 &＃61; nn.Linear(35,35) self.linear2 &＃61; nn.Linear(35,5) def forward(self,s): s&＃61;torch.FloatTensor(s) s &＃61; s.view(s.size(0),1,35) s &＃61; self.linear1(s) s &＃61; self.linear2(s) return s class DQN(object): def __init__(self): self.net,self.target_net &＃61; DQNNet(),DQNNet() self.learn_step_counter &＃61; 0 self.memory &＃61; [] self.position &＃61; 0 self.capacity &＃61; MEMORY_CAPACITY self.optimizer &＃61; torch.optim.Adam(self.net.parameters(), lr&＃61;LR) self.loss_func &＃61; nn.MSELoss() def choose_action(self,s,e): x&＃61;np.expand_dims(s, axis&＃61;0) if np.random.uniform() < 1-e: actions_value &＃61; self.net.forward(x) action &＃61; torch.max(actions_value,-1)[1].data.numpy() action &＃61; action.max() else: action &＃61; np.random.randint(0, 5) return action def push_memory(self, s, a, r, s_): if len(self.memory) < self.capacity: self.memory.append(None) self.memory[self.position] &＃61; Transition(torch.unsqueeze(torch.FloatTensor(s), 0),torch.unsqueeze(torch.FloatTensor(s_), 0),\\ torch.from_numpy(np.array([a])),torch.from_numpy(np.array([r],dtype&＃61;&＃39;float32&＃39;)))# self.position &＃61; (self.position &＃43; 1) % self.capacity def get_sample(self,batch_size): sample &＃61; random.sample(self.memory,batch_size) return sample def learn(self): if self.learn_step_counter % TARGET_NETWORK_REPLACE_FREQ &＃61;&＃61; 0: self.target_net.load_state_dict(self.net.state_dict()) self.learn_step_counter &＃43;&＃61; 1 transitions &＃61; self.get_sample(BATCH_SIZE) batch &＃61; Transition(*zip(*transitions)) b_s &＃61; Variable(torch.cat(batch.state)) b_s_ &＃61; Variable(torch.cat(batch.next_state)) b_a &＃61; Variable(torch.cat(batch.action)) b_r &＃61; Variable(torch.cat(batch.reward)) q_eval &＃61; self.net.forward(b_s).squeeze(1).gather(1,b_a.unsqueeze(1).to(torch.int64)) q_next &＃61; self.target_net.forward(b_s_).detach() # q_target &＃61; b_r &＃43; GAMMA * q_next.squeeze(1).max(1)[0].view(BATCH_SIZE, 1).t() loss &＃61; self.loss_func(q_eval, q_target.t()) self.optimizer.zero_grad() # reset the gradient to zero loss.backward() self.optimizer.step() # execute back propagation for one step return loss Transition &＃61; namedtuple(&＃39;Transition&＃39;,(&＃39;state&＃39;, &＃39;next_state&＃39;,&＃39;action&＃39;, &＃39;reward&＃39;))

3、运行结果

各个部分都完成之后就可以组合在一起训练模型了&＃xff0c;流程和用CARLA差不多&＃xff0c;就不细说了。

初始化环境&＃xff08;DQN的类加进去就行了&＃xff09;&＃xff1a;

import gym import highway_env from matplotlib import pyplot as plt import numpy as np import time config &＃61; \\ "observation": "type": "Kinematics", "vehicles_count": 5, "features": ["presence", "x", "y", "vx", "vy", "cos_h", "sin_h"], "features_range": "x": [-100, 100], "y": [-100, 100], "vx": [-20, 20], "vy": [-20, 20] , "absolute": False, "order": "sorted" , "simulation_frequency": 8, # [Hz] "policy_frequency": 2, # [Hz] env &＃61; gym.make("highway-v0") env.configure(config)

训练模型&＃xff1a;

dqn&＃61;DQN() count&＃61;0 reward&＃61;[] avg_reward&＃61;0 all_reward&＃61;[] time_&＃61;[] all_time&＃61;[] collision_his&＃61;[] all_collision&＃61;[] while True: done &＃61; False start_time&＃61;time.time() s &＃61; env.reset() while not done: e &＃61; np.exp(-count/300) #随机选择action的概率&＃xff0c;随着训练次数增多逐渐降低 a &＃61; dqn.choose_action(s,e) s_, r, done, info &＃61; env.step(a) env.render() dqn.push_memory(s, a, r, s_) if ((dqn.position !&＃61;0)&(dqn.position % 99&＃61;&＃61;0)): loss_&＃61;dqn.learn() count&＃43;&＃61;1 print(&＃39;trained times:&＃39;,count) if (count%40&＃61;&＃61;0): avg_reward&＃61;np.mean(reward) avg_time&＃61;np.mean(time_) collision_rate&＃61;np.mean(collision_his) all_reward.append(avg_reward) all_time.append(avg_time) all_collision.append(collision_rate) plt.plot(all_reward) plt.show() plt.plot(all_time) plt.show() plt.plot(all_collision) plt.show() reward&＃61;[] time_&＃61;[] collision_his&＃61;[] s &＃61; s_ reward.append(r) end_time&＃61;time.time() episode_time&＃61;end_time-start_time time_.append(episode_time) is_collision&＃61;1 if info[&＃39;crashed&＃39;]&＃61;&＃61;True else 0 collision_his.append(is_collision)

我在代码中添加了一些画图的函数&＃xff0c;在运行过程中就可以掌握一些关键的指标&＃xff0c;每训练40次统计一次平均值。

平均碰撞发生率&＃xff1a;

epoch平均时长(s)&＃xff1a;

平均reward&＃xff1a;

可以看出平均碰撞发生率会随训练次数增多逐渐降低&＃xff0c;每个epoch持续的时间会逐渐延长&＃xff08;如果发生碰撞epoch会立刻结束&＃xff09;

四、总结

相比于我在之前文章中使用过的模拟器CARLA&＃xff0c;highway-env环境包明显更加抽象化&＃xff0c;用类似游戏的表示方式&＃xff0c;使得算法可以在一个理想的虚拟环境中得到训练&＃xff0c;而不用考虑数据获取方式、传感器精度、运算时长等现实问题。对于端到端的算法设计和测试非常友好&＃xff0c;但从自动控制的角度来看&＃xff0c;可以入手的方面较少&＃xff0c;研究起来不太灵活。

推荐阅读点击标题可跳转

Python 学习手册
Pandas 学习大礼包
100&＃43; Python 爬虫项目
100 道 Python 经典练习题
Python 数据分析入门手册
2022最强Python学习神器来了
70 个 Python 经典实用练手项目
20张高清数据分析(Python)全知识地图
14 张 Python 速查表玩转数据分析&机器学习

推荐阅读

php
Python 异步编程：深入理解 asyncio 库（上）

本文介绍了 Python 3.4 版本引入的标准库 asyncio，该库为异步 IO 提供了强大的支持。我们将探讨为什么需要 asyncio，以及它如何简化并发编程的复杂性，并详细介绍其核心概念和使用方法。 ... [详细]

蜡笔小新 2024-12-28 11:52:00
schema
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
utf-8
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
go
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
callback
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
command
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
join
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
php
使用Numpy实现无外部库依赖的双线性插值图像缩放

本文介绍如何仅使用Numpy库，通过双线性插值方法实现图像的高效缩放，避免了对OpenCV等图像处理库的依赖。文中详细解释了算法原理，并提供了完整的代码示例。 ... [详细]

蜡笔小新 2024-12-28 13:15:40
string
PyCharm中配置Pylint静态代码分析工具

本文详细介绍如何在PyCharm中配置和使用Pylint，帮助开发者进行静态代码检查，确保代码符合PEP8规范，提高代码质量。 ... [详细]

蜡笔小新 2024-12-28 10:16:06
rsa
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
callback
使用Objective-C和dispatch库实现并发素数计算

本文介绍如何使用Objective-C结合dispatch库进行并发编程，以提高素数计数任务的效率。通过对比纯C代码与引入并发机制后的代码，展示dispatch库的强大功能。 ... [详细]

蜡笔小新 2024-12-28 08:44:35
bit
python的交互模式怎么输出名文汉字[python常见问题]

在命令行模式下敲命令python，就看到类似如下的一堆文本输出，然后就进入到Python交互模式，它的提示符是>>>，此时我们可以使用print() ... [详细]

蜡笔小新 2024-12-27 21:32:05
php
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
php
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
io
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48

幻想6666_321

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章